27 research outputs found

    Open repositories 2012

    Get PDF

    Exploring meta-analysis for historical corpus linguistics based on linked data

    Get PDF
    Empirical work on English historical corpus linguistics is plentiful but fragmented, and some of it is hard to come by. This paper proposes a solution for making it more accessible and reusable for meta-analysis. We present an online Language Change Database (LCD), which provides comparative, real-time baseline data from earlier corpus-based studies. LCD entries summarize the findings and include numerical data from the articles. We discuss the LCD from the perspective of database design and linked data management. Furthermore, we illustrate the reuse of LCD data through a meta-analysis of the history of English connectives. For this purpose, we have developed an application called the LCD Aggregated Data Analysis workbench (LADA). We show how researchers can use LADA to filter, refine and visualize LCD data. Thus we are paving the way for a future where both research results and research data are regularly available for verification, validation and re-use.Peer reviewe

    Relevance Feedback Search Based on Automatic Annotation and Classification of Texts

    Get PDF
    Peer reviewe

    Helsingin yliopiston kirjaston tutkimusdataprojekti : Loppuraportti versio 1.2

    Get PDF
    Tämän pilottiprojektin tavoitteena oli pureutua tutkimusdatan hallinnan, käytön ja säilyttämisen problematiikkaan yhden Helsingin yliopistossa toimivan, kansainvälisen tutkimusryhmän kautta. Tarkoituksena oli, että projektin avulla selvitetään tutkijoiden tutkimusdataan tutkimusprosessin eri vaiheissa liittyviä käytäntöjä, kysymyksiä ja ongelmia. Työryhmän tuli pohtia kirjaston roolia jatkossa näissä kysymyksissä ja niiden ratkaisemisessa. Yhdeksi merkittäväksi tavoitteeksi pilottiprojektille asetettiinkin, että se antaa mahdollisuuden kartuttaa kirjastohenkilöstön aihepiiriin liittyvää osaamista. Lisäksi tavoitteena oli yleisemmällä tasolla pohtia, millaisin toimin käyttäjäystävällisen, integroidun informaatioympäristön rakentamista voitaisiin edistää. Pilotin kautta paljastui varsin karu todellisuus siitä, miten tutkijat kamppailevat työssään puutteellisen ohjeistuksen ja suunnittelun sekä olemattomien datanhallintaresurssien kanssa, käytännöllisesti katsoen ilman mitään käytännön tukea. Tutkijat toivoivat tietoa siitä, mihin paikkaan, millaista aineistoa ja kuinka paljon dataa voi tallentaa. Datarakenteen ja tiedostokuvausten osalta oli tarvetta apuun ja tukeen jo tutkimusprojektin suunnitteluvaiheessa. Tukea tarvittiin myös lupa-asioiden hoitamiseen, kuten datan omistus- ja käyttöoikeuksiin mm. projektin käynnistys- ja lopetusvaiheiden kirjauksiin sopimuksista. Tässä loppuraportissa työryhmä esittää useita ehdotuksia, joiden avulla tilannetta voitaisiin parantaa. Pilotin kuluessa kirjaston työryhmä on toiminut hyvässä yhteistyössä monien yliopiston sisäisten ja ulkoisten tahojen kanssa. Käsityksemme siitä, että tutkimusdataan liittyviä ongelmia ja käytännön toimintatapoja voi kehittää ainoastaan yhteistyössä monien eri tahojen kanssa, on entisestään vahvistunut. Tästä yhteistyöstä ja tehtäväjaosta eri toimijoiden kesken työryhmä tekee myös ehdotuksen. Helsingin yliopiston kirjaston rooliksi työryhmä ehdottaa datan hallintapalvelujen integrointia, koordinointia ja tukea, metadataan ja järjestelmien käyttöliittymiin (esim. haettavuus, linkitykset) liittyviä tehtäviä, tiettyä osaa koulutuksesta, viestintää, neuvontaa ja opetusaineiston valmistamista. Kirjasto toimii kaikilla kampuksilla ja on näin ollen lähellä kaikkien tieteenalojen tutkijoita. Siellä on kootusti eri tieteenalojen käytäntöjä tunteva ja tiedon järjestämisen, etsimisen ja tähän erikoistuneisiin tietojärjestelmiin perehtyneitä ammattilaisia. Olisi toivottavaa, että Helsingin yliopiston kirjasto entistä rohkeammin hakeutuisi yhteistyöhön tutkijoiden ja muiden yliopiston osaajien kanssa. Tulosta syntyy arjessa, "solmumaisesti" työskentelemällä. On tutkijoiden, tutkimustyön ja yliopiston etu, että työryhmän ehdottamiin toimiin tartutaan

    LawSampo Portal and Data Service for Publishing and Using Legislation and Case Law as Linked Open Data on the Semantic Web

    Get PDF
    Publisher Copyright: © 2022 Copyright for this paper by its authors.This paper argues for the idea of publishing legislation and case law as Linked Open Data (LOD) on the Semantic Web, to cater several user groups, including the general public, legislators, lawyers, researchers of legal informatics, and application developers. To support the argument, the proof-of-concept system LawSampo - Finnish Legislation and Case Law on the Semantic Web is introduced, including a semantic portal and a LOD service. Based on the Sampo Model, the main novelty of LawSampo is the provision of heterogenous distributed legal data through multiple application perspectives for faceted searching and exploring the data and for data analysis in legal informatics.Peer reviewe

    Language Change Database: a new online resource

    Get PDF
    We introduce the Language Change Database (LCD), which provides access to the results of previous corpus-based research dealing with change in the English language. The LCD will be published on an open-access linked data platform that will allow users to enter information about their own publications into the database and to conduct searches based on linguistic and extralinguistic parameters. Both metadata and numerical data from the original publications will be available for download, enabling systematic reviews, meta-analyses, replication studies and statistical modelling of language change. The LCD will be of interest to scholars, teachers and students of English.Peer reviewe
    corecore